Крейг Вентер - Расшифрованная жизнь. Мой геном, моя жизнь
Наконец, когда толпа желавших поговорить со мной один на один рассосалась, ко мне подошел высокий, седой, добродушного вида господин в очках. «Я думал, вы с рожками», – сказал он, намекая на мой демонический образ, созданный прессой. Это был Хэмилтон Смит из Университета Джона Хопкинса. Я, конечно, слышал о Хэме раньше – благодаря безупречной репутации Смита, широкой известности в научных кругах и полученной им Нобелевской премии. Он мне сразу понравился, потому что явно собирался сделать собственные выводы обо мне и моих исследованиях, не полагаясь на чужое мнение.
Смит открыл ферменты рестриктазы, молекулярные «ножницы» для разрезания ДНК в точно определенном месте. Сегодня известны сотни рестриктаз. Одни распознают 4 пары оснований, такие как GTAC, и разрезают ДНК в тех участках последовательности, где встречают GTAC. Другие однозначно распознают 8 пар оснований – такие палиндромы встречаются только один раз на каждую сотню тысяч пар оснований. Чем больший палиндром распознает рестриктаза, тем реже она встречается. Открытия Смита очень широко используются, и молекулярная биология, возможно, не достигла бы без них своего нынешнего уровня. В 1972 году Пол Берг использовал ферменты рестрикции для создания с помощью бактерий чужеродного белка, положив начало современной биотехнологической промышленности. Первые карты геномов даже называли «рестрикционными картами», построенными на основании размера фрагментов, выявленных с помощью данного фермента. Сегодня эти карты используются, среди прочего, для геномной идентификации в криминалистике.
Мы со Смитом зашли пропустить по рюмочке в бар, и вскоре мне стало ясно, что этот весьма скромный человек не желает почивать на лаврах своих прежних достижений. Пока я пил пиво, он потягивал коктейль «Манхэттен» и расспрашивал о нашем секвенировании, его точности, оборудовании и открываемых генах. Я пригласил его пообедать со мной и кое с кем из моих друзей. Он объяснил, что ему, как лауреату Нобелевской премии, нужно сегодня присутствовать на официальном ужине в качестве «свадебного генерала», но потом сказал: «Да ну их!», и мы присоединились к небольшой веселой вечеринке в местном ресторанчике, которая, по испанской традиции, затянулась до самого утра.
После ужина мы вернулись в отель для продолжения разговора. Хотя Смит старше меня больше чем на десять лет, у нас оказалось много общего. В детстве мы оба любили строить всякие штуковины, вдохновленные примером старших братьев (к сожалению, у брата Хэма было психическое заболевание, и его положили в больницу), и мы оба получили медицинское образование. Хэм тоже служил в армии, в Сан-Диего. И у него однажды тоже было столкновение с Биллом Хазелтайном – Хэм заподозрил его в попытке задержать публикацию статьи конкурента. На следующий день я пригласил его стать членом Научно-консультативного совета TIGR.
В том же году Хэм принял участие в первом заседании совета, где он поднял руку и спросил: «Вы себя называете Институтом геномных исследований. Как насчет того, чтобы этим и заняться?» Он рассказал нам о Haemophilus influenzae (гемофильной палочке), которую он исследовал в течение двадцати лет и выяснил, что ее геном меньше, чем у E. coli, и что она обладает и другими свойствами, которые делают ее идеальным кандидатом для секвенирования. Я давно искал подходящий геном, чтобы попробовать метод дробовика для секвенирования всего генома. Идея секвенирования H. Influenzae мне очень понравилась, к тому же у H. Influenzae был сходный состав по соотношению G/C с ДНК человека. Появлялась реальная возможность впервые секвенировать геном свободноживущего организма, досконально изученного Хэмом.
Наше сотрудничество набирало обороты с некоторым трудом. Хэм объяснял это тем, что с библиотеками клонов, содержащих фрагменты генома H. Influenzae, имеются проблемы. Только спустя годы он признался, что его коллеги из Университета Джона Хопкинса относились ко мне с большим подозрением из-за нападок Уотсона и других критиков, и он опасался, что работа со мной повредит его репутации. И все-таки Хэм решил создать библиотеку генов Haemophilus. А у нас уже была подходящая компьютерная программа для сборки фрагментов. Хэм смоделировал некую имитацию сборки и считал возможным осуществить ее с примерно 25 тысячами участков. Сотрудники TIGR были полны энтузиазма, а вот изобретатель геномного ассемблера TIGR Грейнджер Саттон не был уверен, что его программа справится с задачей восстановления всей секвенированной ДНК обратно в геном, состоящий из 1,8 миллиона пар оснований. Грейнджер был не только молчалив, но и очень скромен: на самом деле, незадолго до этого его программа соединила в кластеры соответствующей ДНК более 100 тысяч последовательностей EST, и я был уверен, что его ассемблер справится с геномом H. Influenzae.
Мы приступили к оформлению гранта в НИЗ на тестирование нашего метода летом 1994 года. Естественно, я беспокоился, что по политическим причинам НИЗ откажется нас финансировать, а нам с Хэмом не терпелось приступить к работе. Исследования геномов дрожжей и E. coli финансировались уже много лет, и если бы мы «переиграли» их с помощью нашего метода, это стало бы началом очень важного этапа: прочитав код патогена, насчитывающего почти миллион пар оснований, мы бы впервые расшифровали геном свободноживущего организма. Вместо того, чтобы девять месяцев ждать весьма вероятного отказа от НИЗ, я принял решение перенаправить часть бюджета TIGR, около миллиона долларов, на исследование H. Influenzae. Я был уверен – этот риск оправдан.
Спустя четыре месяца мы получили последовательности 25 тысяч участков ДНК H. Influenzae, и команда Грейнджера взялась за дело. Через несколько недель из фрагментов было собрано несколько очень больших отрезков генома. Но оставались еще некоторые мелкие неучтенные фрагменты, и было не совсем ясно, как они встроены в хромосому.
Эти результаты не оправдали «великой геномной мечты», в которой все клоны ДНК генома выращивались в E. coli, секвенировались, затем собирались вместе с помощью компьютера, и, в конце концов, появлялась целиком вся хромосома. Но так происходит очень редко, и на то есть веские причины. Одна из них – зависимость роста чужеродных фрагментов ДНК от бактериальной среды E. coli. Некоторые ДНК явно токсичны для E. coli, и они удаляются биохимическим механизмом ее клеток. Рестриктазы используются бактериями для защиты от атак чужеродных ДНК, постоянно циркулирующих вокруг, например от вирусов.
Тем не менее недостающие куски геномной головоломки помогли мне понять, что карта генома может упорядочить последовательность и собранные фрагменты таким же образом, как картинка готовой головоломки помогает в ее сборке, даже если некоторые элементы отсутствуют. Подобно мореплавателям, генетики на протяжении многих лет использовали различные виды карт. Среди них – так называемые функциональные карты, или карты сцепления.
При воспроизведении гены материнского организма часто, но не всегда, передаются потомству. Чем дальше друг от друга расположены гены на хромосоме, тем меньше вероятность, что такая передача произойдет. Изучая частоту совместной передачи двух генов из поколения в поколение, ученые могут оценить, насколько близко на хромосоме они расположены, и создать карту сцепления. Впервые хромосома была картирована таким образом в начале 1990-х великим американцем Томасом Хантом Морганом при исследовании плодовой мушки. В его честь был назван участок гена, состоящий из около одного миллиона пар оснований генетического кода – сантиморган. О карте с таким разрешением генетики давно мечтали.
Другой вид генетических карт – физическая карта, основанная на поиске физического местоположения данного гена. Определяется, на какой хромосоме находится ген, с чем соседствует, и в каком именно участке хромосомы находится.
Но я не собирался создавать ни карту сцепления, ни физическую карту до секвенирования, как это сделали мои конкуренты. Команда Фреда Блаттнера потратила три года на разработку карты клона лямбды E. coli, и конечным результатом их работы стали 18 перекрывающихся килобаз клонов, подобных сцепляющимся друг с другом элементам игры «Лего», – грандиозный подвиг традиционного генетического исследования. Но у меня не было необходимости создавать такую карту. Каждый, кто хоть раз собирал пазл, знает, что можно продолжать сборку, не зная всей картинки, если идти от краев и других узнаваемых частей снизу вверх. В общем-то, последовательность ДНК сама является конечной физической картой, в которой все пары оснований генетического кода известны, так же как и точный порядок их расположения.